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Нейросетевое моделирование при решении 
обратных задач обработки аналитической 
информации 


Обсуждается подход к использованию нейронных сетей в качестве конкурирующей вычислительной 
технологии при обработке аналитической информации. Разработана общая функциональная схема и алгоритм 
преобразования аналитической информации в рамках принципа конкуренции. Основное внимание 
уделяется выбору топологии нейронной сети и ее структурному и параметрическому синтезу. 


Введение 


Аналитическое приборостроение является интенсивно развивающейся областью 
измерительной техники, предназначенной для исследования состава и свойств веществ. 
Развитие этого направления идет по пути улучшения характеристик аналитических 
приборов и новых методов анализа результатов измерений. Среди задач аналитического 
приборостроения следует выделить сжатие диапазона аналитической информации, фун- 
кциональное преобразование, фильтрация, детектирование и разделение наложенных ана- 
литических сигналов, а также их коррекция. Многие из этих задач относятся к обработке 
сигналов при использовании хромато-масс-спектрометров — приборов для исследования 
характеристик вещества [1-21]. 

Совершенствование вычислительных технологий обработки измерительной инфор- 
мации для сигналов сложной формы связано с развитием методов искусственного интел- 
лекта. Перспективным подходом при решении таких задач является применение искус- 
ственных нейронных сетей. Реализация нейросетевого базиса для решения задач 
аналитического приборостроения обусловлена особенностью нейронных сетей к воспри- 
ятию, обработке и запоминанию информации. Этому способствует разработка новых 
методов построения и обучения нейронных сетей [5-7]. В работе синтезирован алгоритм 
функционирования нейронной сети, реализующий метод обработки сложных сигналов. 
В основу метода положен критерий, минимизирующий остаточную мощность сигнала, 
полученного после выделения полезного сигнала на фоне шумовых возмущений. 
Практический интерес также представляет задача выявления скрытых закономерностей 
сигнала. Для решения этих задач в диссертации используются радиально-базисные 
нейронные сети (ВВЕ-сети) [5], [7], [16], [18], [20]. 

Задача восстановления входного сигнала получила название обратной задачи, 
которая состоит в решении интегрального уравнения относительно сигнала, действующего 
на входе измерительного канала. Особенностью обратной задачи является нарушение 
непрерывности оператора преобразования измерительной информации в измеритель- 
ном канале. В результате при реализации обратного оператора даже малые погрешности 
измерений приводят к нарушению регулярности решения. Это свойство обратной задачи 
свидетельствует о ее некорректности и необходимости применения специальных алго- 
ритмов решения в виде модификации метода регуляризации А.Н. Тихонова [17]. 
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Принцип конкуренции при реализации задачи повышения 
эффективности обработки аналитической информации 


Рассмотрим концептуальную модель и процедуры обработки аналитической 
информации в рамках принципа конкуренции. Приведем схему алгоритма сравнитель- 
ного анализа альтернативных решений при обработке данных измерений аналитических 
сигналов с использованием традиционных и нейросетевых методов. 

Реакция реального аналитического прибора на какой-либо компонент анализи- 
руемого вещества представляет собой функцию у„(х) от независимого аргумента х. 
Эта функция определяется механизмом функционирования прибора. Реакция прибора 
А(х) зависит также и от характеристик преобразователя «свойство — выходной сигнал» 
или регистрирующего устройства (детектора по теплопроводности в термическом 
сигнале и хроматографии, диспергирующего элемента в спектроскопии). 

Таким образом, на выходе реального аналитического прибора наблюдается анали- 
тический сигнал у›(х), обусловленный реакцией идеального прибора у„(х) и функцией 
А(х). Обычно эти функции связаны друг с другом через формулу свертки [13-15]: 


=», ДА - хх (1 


и для большинства аналитических приборов имеют конечную площадь, т.е. имеют вид 
пика (например, Гауссова), характеризующегося интенсивностью и шириной. 

Если ширина функции у,(х) много меньше ширины функции А(х), то наблю- 
даемый аналитический сигнал описывается выражением: 


у, (х) = А(х— м) [ у,ядах, = К.А(х-х), (2) 


где К’) — константа. Реальный сигнал на выходе прибора в этом случае соответствует 
функции прибора. Если же ширина функции у„(х) много больше ширины функции 
А(х), то наблюдаемый сигнал описывается выражением: 


у, (х) = у, (®)[ Ах м) ах, = К,у, (8), (3) 


где К> — константа, а реальный сигнал соответствует сигналу на выходе идеального 
прибора. 

При сравнимой ширине функции и реакции прибора возникает погрешность, 
определяемая видом функции А(х). Большая часть поступающих на вход аналитиче- 
ских систем сигналов нестандартны и требуют предварительной обработки по устранению 
этой погрешности. Это достигается с помощью специально разработанных алгоритмов 
обработки аналитической информации, которые реализуются с помощью современных 
вычислительных средств, встраиваемых в аналитический прибор. В результате такой 
интеграции создаются аналитические комплексы, имеющие достаточный объем памяти 
(особенно необходимый в хроматографическом эксперименте) и способные работать 
в режиме реального времени (в такте эксперимента). 

Рассмотрим подход к разработке аналитического комплекса, использующего в 
качестве алгоритмов обработки информации конкурирующие вычислительные тех- 
нологии, основанные на традиционных методах и нейросетевых алгоритмах. Одной 
из центральных задач использования этого подхода является формирование ядра 
системы, включающего в себя предметную область, базу знаний и базу данных. Для со- 
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здания этой совокупности формируется концептуальная модель аналитического комплекса 
(рис. 1), ориентированная на решение обратных задач измерительной техники с целью 
эффективного улучшения разрешающей способности применяемых технических средств. 
В функциональном аспекте такая модель включает следующие компоненты [12]: 


ЗЕ = <Х, У, А, Ре,> (4) 
ЗЕ= {ЭЕ1...., ЗЕМ} — СОВОКУПНОСТЬ функциональных элементов, определяющих интегри- 
рованный комплекс; Хх =Х Е ( ИЕ 1.п) и У=У, ( =1, т) — вектор-множества входных и выход- 


ных сигналов; А: Х —> У - оператор, определяющий процесс функционирования системы 
Зв; Ре —множество функциональных параметров. 


Принципы организации и функционирования 


Стандартный ини Нейросетевой 
алгоритм [ф контроля аналитической < алгоритм 
информации 


Априорная информация 


Рисунок 1 — Концептуальная модель аналитического комплекса 


Реализация концептуальной модели осуществляется на основе принципа конку- 
ренции (рис. 2), использование которого позволяет повысить достоверность резуль- 
татов анализа за счет выбора наиболее предпочтительной вычислительной технологии в 
зависимости от особенностей исследуемого сигнала [12]. 


Моделирование 
сигналов 


Стандартная 


Генерация | [— модель ==) Анализ 
альтерна- альтернатив 


тивных ивыбор 
решений [>| Нейросетевая |[> решения 
модель 


Рисунок 2 — Реализация принципа конкуренции 


Концепция конкуренции особенно эффективна в сложных ситуациях при наличии 
значительных помех и скрытых особенностей сигналов. Как показывают результаты иссле- 
дований [14], полной редукции к идеальному прибору при решении обратных задач 
измерительной техники достигнуть не удается из-за неточного знания аппаратурной 
функции системы измерений или другого физического прибора, наличия погрешности 
реализации корректирующего устройства (фильтра) и некорректности обратной задачи. 


Выбор модели нейронной сети и методов ее обучения 


Результаты аналитического обзора состояния вопроса позволили осуществить 
выбор топологии нейронной сети, обеспечивающей эффективную обработку аналити- 
ческой информации применительно к задаче хромато-масс-спектрометрического анализа. 
В процессе рассмотрения имеющихся нейросетевых методов анализа и интерпретации 
измерительной информации выделены структуры нейронных сетей, реализующие задачи 
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выделения основных признаков обрабатываемых сигналов. Наибольший интерес для 
рассматриваемой предметной области представляют радиально-базисные сети (КаФ1а1 
Ваз15 Еипсйоп) [4], [7], [16], [20]. 

В отличие от многослойного персептрона, в котором при решении задач класси- 
фикации исследуемое пространство разбивается гиперплоскостями, в КВЕ-сетях такое 
разбиение осуществляется окружностями (в общем случае гиперсферами), которые 
задаются своим центром и радиусом. Поскольку положение точки в №-мерном прос- 
транстве определяется числовыми параметрами (весовыми коэффициентами для мно- 
гослойного персептрона), то по аналогии координаты центров радиальных элементов 
можно рассматривать как «веса», а радиус как «порог». 

Рассмотрим общую характеристику КВЕ-сетей на основании работ [7], [16], [20]. 
Математическая модель формального нейрона в КВЕ-сети имеет вид: 


у = Кпекх,\/)), (5) 
где у — выходной сигнал; Г— функция активации; пеХ,\\/) — дискриминантная функция: 
М 
№ Хх, \) = ТИХ) =МИ(Х), (6) 


= 
где Х — входной вектор; И’ - вектор весовых коэффициентов. 

Дискриминантная функция представляет собой скалярное произведение /Л- 
мерного вектора весовых коэффициентов И’ и вектора О0(Х), каждая компонента 
которого является некоторой функцией входного вектора Х. Структура вектора 0(Х) 
задает свойства нейрона. 

В задачах обработки измерительной информации дискриминантная функция 
пекХ, И’) (6) может представлять собой отрезок многомерного ряда Тейлора степени Г. 
Если степень Г. = 1, то соответствующий нейрон называется нейроном первого порядка. 
В противном случае рассматривают нейроны высших порядков [16], [20]. В этом случае 
коэффициенты разложения отрезка многомерного ряда Тейлора образуют вектор весовых 
коэффициентов И’ и функция пен (Х, И’) нейрона первого порядка имеет вид [16]: 


М 
Мей (Х, И’) = т + Улих, =ТИ(Х), (7) 
= 
где И’ = (м»..., им) — вектор весовых коэффициентов нейрона; ((Х) = (1,хь..., хм — рас- 
ширенный вектор входа нейрона; х; — /-я компонента М-мерного входного вектора Х. 
Для нейрона второго порядка дискриминантная функция равна: 


М м Л 
Ме, (Х, И’) =т+У м, + У ми хх, = ИСХ), (8) 
= 5 А 
где И’ И» / = Г,...,М, К = [,...„/-= компоненты вектора весовых коэффициентов, а рас- 
ширенный входной вектор имеет вид: 


1009) =: (1х1, ...) ХМ х. Х2х1, ...› хк). (9) 

Компоненты вектора О(х) могут быть более сложными функциями, чем функции, 

образующие отрезок ряда Тейлора. В частности, довольно распространенной является 
функция: 

и(Х) = г), (10) 


т 12 ы 
где и; = ((Х- СУ (Х- С) ? — евклидово расстояние от точки Х до заданной точки С. 
Нейронную сеть, использующую описанные нейроны, называют ИНС радиально базис- 
ных функций ЕВЕ. Вид базисной функции в этом выражении определяет название сети. 
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Так, если функция задается выражением 
(г) = ехр (—:”/ 20°), (11) 


где о — параметр, определяющий размах базисной функции, такая ВВЕ-сеть называ- 
ется сетью гауссовых базисных функций. 

Топология КВЕ-сети представлена на рис. 3. Сеть имеет один промежуточный слой, 
состоящий из радиальных элементов, каждый из которых воспроизводит гиперсферу. 
Базисные функции нелинейны и нет необходимости выбирать более одного промежуточ- 
ного слоя. Для моделирования любой функции достаточно взять определенное число 
радиальных элементов. Обучение промежуточного слоя реализовано по алгоритму 
объективной классификации. 


Рисунок 3 — Топология ВВЕ-сети: шриф, оиёри{ — входной и выходной слои; 
С.,....Сш- кластеры 


Выход сети ВКЕ формируется в результате комбинации выходов скрытых радиаль- 
ных элементов. Оказывается, что достаточно взять их линейную комбинацию. Поэтому 
сети ВКЕ имеют выходной слой, состоящий из элементов с линейными функциями 
активации. Это позволяет не проводить их обучение. 

Сети ВКЕ имеют ряд преимуществ, которые могут быть использованы при анализе 
хромато-масс-спектрометрических сигналов: 

— обеспечение моделирования произвольной нелинейной функции с помощью 
всего одного промежуточного слоя, в результате чего отпадает необходимость решения 
вопросов о числе слоев нейронной сети; 

— возможность полной оптимизации параметров линейной комбинации в выходном 
слое с помощью хорошо известных методов линейной оптимизации (при обучении 
отсутствует возможность попадания в локальный минимум). 

В результате ВКЕ-сети обучаются значительно быстрее, чем многослойный персеп- 
трон. При этом следует иметь в виду, что в промежуточном слое в процессе обучения 
для радиальных элементов необходимо определять положения их центров и величины 
отклонений. Проведенный анализ концепций и путей построения КВЕ-сетей позволил 
сформулировать последовательность выполнения операций на этапе предварительной 
обработки информации при подаче на нейронную сеть и пути модернизации имею- 
щихся алгоритмов обучения с учетом особенностей обработки аналитической инфор- 
мации [1], [13-15]. В контексте параметрического синтеза КВЕ-сети задача проекти- 
рования состоит в выборе такого тестового набора образов исследуемых сигналов, 
который позволил бы, с одной стороны, построить аналитическую оценку исходя из 
структурных характеристик сети, а с другой — реализовать экспериментальную проверку. 

Процедуры нейросетевого моделирования охватывают круг задач, связанных с 
созданием конкурирующей вычислительной технологии формирования различных 
структур КВЕ-сетей — сети стандартной конфигурации и нейросетевого ансамбля [12], 
реализующего эталонные сигналы. При построении ансамбля нейронных сетей учи- 
тываются особенности типичных задач обработки аналитической информации [8], 
которые нашли применение в традиционных алгоритмах (рис. 4). 
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Рисунок 4 — Типичные сигналы, используемые при построении нейросетевого ансамбля: 
верхние рисунки: слева — сигнал с фоном: А — постоянный фон; В — наклонный линейный 
фон; С — монотонный нелинейный фон; О — фон с выраженным максимумом; 
| — сигнал с фоном; 2 — фон; 3 — сигнал без фона; справа — детектирование аналити- 
ческого пика: по порогу (А); по производной (В); средние рисунки: аналитический спектр 
с хорошим (А) и плохим (В, С) разделением сигналов; нижние рисунки: разделение 
аналитических пиков: А, В — исходная и преобразованная спектрограммы; 

1 — 5 составляющие спектрограммы 


Структура программного средства обработки 
аналитической информации 


Рассмотрим структуру программного средства обработки аналитической информа- 
ции. Выделим задачи обработки информации в процессе функционирования программного 
средства, логически сгруппированные по уровням, между которыми установлены связи 
в соответствии с эталонными моделями. 

Структурная схема программного средства может быть представлена в виде сис- 


темы 5р, определяемой элементами: 
Эм = <МЕ, Се, Рм>, (12) 


где МЕ - множество элементов системы (приборы, алгоритмы, вычислительные сред- 
ства); Се — множество, определяющее совокупность связей между элементами; Рим -— 
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множество параметров, характеризующих физические закономерности и особенности 
исследуемых сигналов. 
Условия формирования системы 5р представляются совокупностью 


Зи = <, В, У, Кь, ЕЕ (13) 


где С — цели функционирования при реализации задачи №; Ив — принципы и алго- 
ритмы управления процессом хромато-масс-спектрометрии; К» — качество результата 
решения задачи; Ес эффективность, определяющая, какой ценой достигается цель С. 

На основе концептуальной модели осуществлен синтез программно-аппаратных 
средств обработки аналитической информации (рис. 5). 


Измерительное 
средство 
: 
сигналов 
Формирование 


исходных данных 
Особенности 
сигналов 


Аппаратные средства 
регистрации 
аналитической 
информации 


Алгоритмы 


обработки 
информации Априорная 
информация 


т Особенности 
интерпретации 
Графическое 


представление 
данных 


Программные средства 
регистрации 
аналитической 
информации 


а) 
Рисунко 5 — Поток информации (а) и программно-аппаратное средство (6) 
обработки данных измерений: СА -— стандартный алгоритм; НС - нейронная сеть 


Полный комплект системы содержит набор аналитических приборов, приборный 
интерфейс, вычислительное средство на базе ЭВМ стандартной конфигурации и алго- 
ритмы обработки информации с использованием стандартных и нейросетевых моделей. 

Вычислительное средство обеспечивает коррекцию искажений, вносимых инерци- 
онностью средств измерений в динамическом режиме и позволяет решать следующие 
задачи: 

— модификация решения обратной задачи в условиях априорной неопределенности; 

— разработка программного обеспечения синтеза средств восстановления сигналов 
в аналитических приборах. 

Решение этих задач ведется с использованием нейросетевых методов в условиях 
нестационарности измеряемого процесса и наличия погрешности задания характерис- 
тик корректируемого измерительного средства. Обработка информации в рассматриваемом 
вычислительном средстве осуществляется в режиме реального времени (в темпе экспе- 
римента). Поскольку используемые алгоритмы обработки аналитической информации 
достаточно громоздки, а число обрабатываемых и контролируемых аналитических сиг- 
налов невелико, используется интерфейс системы машинного типа. 

На рис. 6 приведена схема интерфейса пользователя при решении задач анализа 
сигналов в задачах хромато-масс-спектрометрии. Из этого рисунка следует, что взаимо- 
действие пользователя с программной системой осуществляется с помощью интерпре- 
татора, являющегося основным звеном для выполнения функции управления последова- 
тельностью обработки измерительной информации. В процессе взаимодействия поль- 
зователь имеет возможность управления блоками логического анализа полученного ре- 
шения с учетом особенностей задачи и априорной информации. В процессе анализа 
выявляются скрытые закономерности исследуемых сигналов и графическая реализация 
результатов анализа. 
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Описание исходной задачи и 
априорная информация 

Блок Блок анализа 
графической Формирование задачи скрытых 
реализации и ее решение закономер- 
результатов ностей 

Блок логического анализа 

решения 


Интерпретатор 
Пользователь 


Рисунок 6 — Интерфейс «Пользователь — Аналитическая система» 


Для уточнения динамических характеристик аналитических приборов, в частности 
хромато-масс-спектрометра, используется рекурсивный метод оценки параметров об- 
ратной характеристики сигналов, описанный в работах [13-15], позволяющий сократить 
объем вычислений при функционировании интегрированного комплекса. 

Программное обеспечение комплекса разбито на функциональные блоки, каждый 
из которых решает самостоятельные задачи анализа и интерпретации измерительной 
информации и находится под управлением системы знаний, отражающей логику его 
функционирования. Эта программа является составной частью общей программы интер- 
претатора, обеспечивающего параллельное решение задачи на основе стандартных и 
нейросетевых алгоритмов, анализ альтернатив и выбор предпочтительной вычислительной 
технологии обработки данных. 

Индикация измерительной информации, результатов анализа, а также текущих 
сообщений о функционировании программного средства осуществляются с помощью 
видеотерминала, входящего в состав интегрированного комплекса. 


Заключение 


Рассмотренные методы и модели формализации знаний при обработке аналити- 
ческой информации позволяют осуществлять интеграцию программно-аппаратного 
средства для исследования сложных физических процессов. По результатам иссле- 
дования можно сделать следующие основные выводы: 

1.В качестве конкурирующей вычислительной технологии обработки аналити- 
ческой информации целесообразно выбирать радиально-базисные нейронные сети, 
на основе которых можно разрабатывать различные конфигурации в соответствии с 
поставленными задачами. 

2.Выделены основные задачи структурного и параметрического синтеза моделей 
КВЕ-сетей для обработки аналитической информации в задачах хромато-масс-спек- 
трометрического анализа. 

3. Сформулированы пути реализации системы обработки аналитической информа- 
ции в задачах хромато-масс-спектрометрического анализа с целью повышения разрешаю- 
щей способности и фильтрации сигналов с учетом особенностей исследуемых процессов. 

Основной задачей математического моделирования сложных аналитических сиг- 
налов с помощью нейронных сетей с КВЕ-архитектурой является нахождение приемлемого 
компромисса между детализацией и простотой описания. При этом учитывается 
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главное отличие КВЕ-сетей от многослойного персептрона, которое состоит в том, что 
каждый нейрон этой сети реализует локальную аппроксимацию в окрестности некоторой 
точки, а не различие между значениями функции в полупространствах. 
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